به گزارش شهرآرانیوز، گوگل تلاش کرده با ارتقای لایه استدلال در مدل جدید خود، یک گام فراتر از تولید متن بر پایه داده های حفظ شده بردارد. Gemini ۳.۱ Pro بر پایه معماریهای پیشرفتهتر طراحی شده تا بتواند مسائل چندمرحلهای، الگوهای ناشناخته و تحلیلهای پیچیده را با دقت بالاتری پردازش کند.

طبق اعلام رسمی گوگل، این مدل در نسخه دوم بنچمارک ARC-AGI موفق به کسب امتیاز ۷۷.۱ درصد شده است؛ رقمی که به گفته این شرکت تقریباً دو برابر عملکرد نسخه پیشین یعنی Gemini ۳ Pro است.
ARC-AGI یکی از آزمونهایی است که تمرکز آن بر سنجش توانایی مدلها در کشف الگوهای جدید و حل مسائل غیرتکراری است؛ یعنی به طوری که برای حل مسئله از داده های از پیش حفظ شده استفاده نکند، حوزهای که بسیاری از مدلهای زبانی در آن با افت عملکرد مواجه میشوند. اگر
این عدد در استفاده کاربران تکرار شود، میتواند نشاندهنده جهش واقعی در حوزه استدلال محاسباتی باشد.
بعضی از کاربران به ویژگی جدیدی اشاره کردند، نمایش و تولید مستقیم انیمیشنهای SVG تنها با یک پرامپت متنی ساده انجام میشود. در این دمو، مدل بدون نیاز به ابزار واسط، کدهای تمیز و آماده استفاده برای برنامه نویسان وب تولید میکند.
چنین قابلیتی در صورت پایداری و دقت بالا، میتواند ابزارهای طراحی و پلاگینهای تولید المانهای گرافیکی را تغییر دهد. بسیاری از سرویسهایی که تاکنون نقش واسط میان ایده و خروجی فنی را ایفا میکردند، حالا با این قابلیت ممکن است با مدلهایی که مستقیماً خروجی قابل استفاده تولید میکنند وارد چالش شوند.
گوگل تأکید کرده است که Gemini 3.1 Pro در سناریوهای کدنویسی چندمرحلهای، تحلیل دادههای حجیم و حل مسائل منطقی پیچیده عملکرد بهتری ارائه میدهد. این بهبود میتواند برای توسعهدهندگان، تحلیلگران داده و تیمهای تحقیقاتی که با پروژههای پیچیده سروکار دارند کمک بزرگی باشد.
در شرایط فعلی که رقابت میان غولهای فناوری بالاگرفته است تمرکز بر کاهش خطای استدلالی اهمیت بیشتری از تولید متن ها با سرعت بالا دارد.
با وجود تمرکز تبلیغاتی بر توانمندیهای جدید، دسترسی به Gemini ۳.۱ Pro برای همه کاربران آزاد نیست. نسخه Pro معمولاً از طریق پلنهای اشتراکی و سرویسهای توسعهدهنده گوگل ارائه میشود و کاربران عادی بدون حساب کاربری یا اشتراک پولی، به این سطح از مدل دسترسی کامل ندارند.
کاربران عمومی در سرویسهایی مانند Google Gemini معمولاً به نسخههای سبکتر دسترسی دارند، در حالی که قابلیتهای پیشرفتهتر از طریق اشتراکهای حرفهای یا API در اختیار توسعهدهندگان قرار میگیرد.
به بیان دیگر، تجربه کامل از توان استدلالی جدید این مدل، در حال حاضر محدود به کاربران اشتراکدار و سازمانی است.
بنابراین مدل زبانی جدید گوگل نشان میدهد رقابت مدلهای زبانی از مرحله «چه کسی متن طبیعیتر تولید میکند» عبور کرده و وارد فاز «چه کسی بهتر فکر میکند» شده است. تمرکز بر استدلال، حل مسئله و تولید خروجیهای فنی، بیانگر تغییر اولویتها در بازار هوش مصنوعی است.
با این حال، قضاوت نهایی درباره میزان برتری این مدل نیازمند ارزیابیهای مستقل و استفاده گسترده در پروژههای واقعی است. اگر ادعاهای گوگل در عمل نیز تأیید شود، Gemini ۳.۱ Pro میتواند به یکی از ابزارهای کلیدی نسل جدید توسعه نرمافزار و پردازش داده تبدیل شود؛ در غیر این صورت، این اعداد نیز مانند بسیاری از بنچمارکهای تبلیغاتی، صرفاً بخشی از جنگ روایتها در رقابت غولهای فناوری خواهد بود.